iT邦幫忙

2024 iThome 鐵人賽

DAY 6
1
生成式 AI

T 大使 AI 之旅系列 第 6

【Day 06】Hugging Face 入門指南

  • 分享至 

  • xImage
  •  

前情提要

上一篇文章使用了各種圖片生成的工具和網站,透過 Open WebUI 介面與模型互動。那說到開源的大語言模型,還得是 Hugging Face 這個平台,從我知道這個平台到現在,開源模型從 10 萬到今天有超過 80 萬,成長速度相當的驚人。

Datasets 資料集

在講模型之前,必須先介紹一下 Hugging Face 資料集,畢竟模型都是透過大量資料訓練出來的。在我知道 Hugging Face 之前,我一直都是用 Kaggle 找一些範例的資料。但在我知道 Hugging Face 之後,就大幅降低了使用 Kaggle 的頻率。

而且很強的是他不只有純文字的資料集,包含圖片、語音、影像甚至是 3D 都有,如果要自己微調模型的話,資源可謂是非常豐富,有選擇障礙的人可能還會挑很久🤣
https://ithelp.ithome.com.tw/upload/images/20240810/20168336ovLiWy6qCi.png

Models 模型

Hugging Face 模型庫 存放各種大語言模型,模型的種類也有百百種。

  • 影像類 -> EX:文本生成圖片、圖片生成文字、影像分類、影像分割、物件偵測
  • 語音類 -> EX:文本生成音檔、語音辨識、語音分割
  • 自然語言 -> EX:文本生成、文本摘要、文本分類
    https://ithelp.ithome.com.tw/upload/images/20240810/20168336iK19cxwgLW.png

Spaces

Spaces 以網頁的方式提供可以直接在網頁上的跟喜歡的模型互動,我以我昨天實作的 Stable Diffusion 的 Model 來試試的結果是生成很快速而且圖片效果也很好。
https://ithelp.ithome.com.tw/upload/images/20240810/201683367k7UfTsOhQ.png

上傳自己的模型

只要有 Hugging Face 的帳號,就可以上傳自己訓練好的模型,不管是 Pytorch 還是 Tensorflow 架構都可以。

社群平台

  • Discord:Hugging Face 有 Discord 社群,我也才剛加入沒多久目前沒什麼心得,但感覺裡面有很多大神可以學習。
  • GitHub:程式開發肯定少不了 GitHub,看起來主要是以 Python 為主。
  • Learn:裡面有很多的課程是手把手教你如何使用 Hugging Face 完成 NLP、ML 的免費課程。

Documentations

Documentations 這邊 Hugging Face 有放很多他相關服務的使用文件,不知道如何下手可以來這邊看看。

結論

Hugging Face 豐富的資源和豐富的開源模型,也很方便與開發者交流。你有聽過的開源模型,在 Hugging Face 上一定找得到。如果現在要使用生成式 AI 或者 ML/DL 的話,Hugging Face 真的是一個一定要知道的平台!

題外話🤣

今天是 Aespa 的台灣演唱會,他們的新歌 SuperNova 真的是不錯。好想去但是沒搶到票,後來加開的也沒有搶到,演算法拜託推多一點別人的現場錄影給我看。希望未來我有機會看到現場的 Aespa 和 IU 🥹🥹🥹

下一篇文章:程式實戰前的準備


上一篇
【Day 05】Ollama UI 圖片生成
下一篇
【Day 07】程式實戰前的準備
系列文
T 大使 AI 之旅30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言